پیوند احتمالاتی رکوردها و تحلیل آماری داده های پیوندیافته

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس
نویسنده افشین فلاح
استاد راهنما محسن محمدزاده
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1388

چکیده

وقتی اطلاعات مختلف مربوط به واحدهای جامعه در چند مجموعه داده یا فایل قرار دارند، بکارگیری تنها یکی از این فایل ها به معنی از دست دادن اطلاعات تکمیلی موجمود در سایر فایل ها است. بنابراین یکپارچه ساختن اطلاعات پراکنده ی افراد یک جامعه در مجموعه داده های مختلف، می تواند برای دسترسی به اطلاعات کامل و غیر تکراری واحدهای جامعه بسیار سودمند باشد. برای این منظور لازم است رکوردهای یکسان درون یک مجموعه داده یا بین مجموعه داده های متفاوت شناسایی و پیوند داده شوند. این کار که پیوند رکوردها نامیده می شود، معمولا به دو صورت قطعی و احتمالاتی صورت می پذیرد. در این رساله پیوند احتمالاتی رکوردها و تحلیل آماری بر مبنای داده های پیوند یافته، مورد مطالعه قرار گرفته است. در فصل 1 مفاهیم اولیه ی پیوند رکوردها معرفی شده اند. در فصل 2 مبانی نظری پیوند رکوردها، مدلهای احتمالاتی آن و قواعد پیوند مختلف از دیدگاههای بسامدی و بیزی مورد بحث و بررسی قرار گرفته اند. در فصل 3 پیوند احتمالاتی رکوردهای فارسی که به دلیل ویژگی های خاص زبان فارسی دارای مشکلات و پیچیدگی های زیادی می باشد، مورد بحث قرار گرفته و راهکارهایی برای حل برخی از دشواری های آن ارائه شده. نحوه ی بکارگیری آنها در قالب دو مثال کاربردی به نمایش گذاشته شده است. فصل 4 به تحلیل رگرسیونی با داده های پیوند یافته اختصاص دارد. نشان داده شده است که به دلیل وجود خطاهای انطباق، برآوردگرهای کمترین توانهای دوم ضرایب رگرسیونی در این حالت لزوما بهینه نیستند. سپس برای تحلیل رگرسیونی با داده های پیوند یافته، روشی مبتنی بر لحاظ نمودن توزیع متغیر پاسخ و با تاگید بر رهیافت بیزی پیشنهاد شده و کارایی روش پیشنهادی در یک مطالعه ی شبیه سازی با سایر روشهای موجود مقایسه شده است. همچنین روشی برای تحلیل رگرسیون لوژستیک با داده های پیوند یافته برای متغیر پاسخ و دوحالتی، با لحاظ نمودن آمیخته ای از توزیع های برنولی و استفاده از الگوریتم em ارائه و براساس آن یک برآوردگر ماکسیمم درستنمایی تکراری برای ضرایب رگرسیونی پیشنهاد شده است. کارایی برآوردگر پیشنهادی و تاثیر خطاهای انطباق بر آن نیز در یک مطالعه ی شبیه سازی مورد ارزیابی قرار گرفته است. نهایتا خلاصه یافته های پژوهشی این رساله به همراه نتایج و پیشنهادات ارائه شده است.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

رتبه بندی تحلیل پوششی داده های فازی برمبنای داده های آماری و فاصله اطمینان آماری

متن کامل

تحلیل پوششی داده ها و تحلیل های آماری

متن کامل

نکات اساسی در تجزیه و تحلیل داده های آماری

این مقاله فاقد چکیده میباشد.

متن کامل

روش شناسی پیوند داده بر اساس الگوریتم احتمالاتی: یک مقاله مروری

امروزه با پیشرفت تکنولوژی و توسعه پژوهش در کشور، شاهد شکل گرفتن بانک های اطلاعاتی بزرگ و ارزشمند هستیم. لازمه ردیابی اطلاعاتافراد در این مجموعه های گرانبها، بکارگیری روشهای جدید واکاوی داده های مرتبط میباشد. با این روشها اطلاعات بسیار مفیدی را میتوان درباره تشخیص، سبب شناختی و پیش آگهی پیامدهای مختلف بدون انجام مطالعات پرهزینه فراهم کرد. گوناگونی در جمعآوری و تعاریف فیلد های حاوی داده های س...

متن کامل

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

متن کامل

مقایسه مدلهای آماری حاشیه ای و آمیخته در تحلیل داده های پزشکی

چکیده زمینه و هدف: امروزه داده های زیادی وجود دارند که در آنها فرض استقلال داده ها که پیش فرض اصلی بسیاری از مدلهای آماری است برقرار نیست. داده های حاصل از نمونه گیری خوشه ای، مطالعات طولی با اندازه گیری های مکرر و یا داده های زوجی مانند داده های دو چشم و همچنین مطالعاتِ همسان سازی شده نمونه هایی از این داده ها هستند مواد و روش کار: دو مدل آماری با در نظر گرفتن همبستگی بین مشاهدات، مدلهای آمیخته...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس

کلمات کلیدی

نظریه بیزی پیوند رکورد توزیع آمیخته رگرسیون داده پیوندی استنباط آماری تحلیل رگرسیون

میزبانی شده توسط پلتفرم ابری doprax.com